目前借助脑电图(EEG)信号目前进行自动睡眠分期研究。最近,基于深度学习(DL)的方法在该领域实现了重大进展,允许在自动睡眠分段中近的人类准确性。然而,基于EEG的睡眠分段需要广泛的以及昂贵的临床设置。此外,在研究下,对课程的专家和增加不便的要求呈现在护理点中不利。心电图(ECG)是脑电图的不引人注目的替代品,更适合,但其性能不成本,与基于EEG的睡眠分段相比,亚比例仍然存在。当然,将知识从EEG转移到ECG,最终提高了基于ECG的投入的模型的性能有助于。知识蒸馏(KD)是DL中的着名概念,用于看起来将知识从更好但潜在的繁琐的教师模型转移到紧凑的学生模型。在这一概念上,我们提出了一个跨模型KD框架,以便通过通过在eeg上培训的型号学习的功能的帮助来提高基于ECG的睡眠分期性能。此外,我们还对所提出的模型的各个组成部分进行多次实验,以便更好地了解蒸馏方法。梦想研究(质量)蒙特利尔档案的200个科目的数据用于我们的研究。所提出的模型分别在4级和3级睡眠分段中分别增加了14.3×%和13.4 \%。这证明了KD在4级(W-L-D-R)和3级(W-N-R)分类中的单通道ECG基于睡眠分段的性能改进的可行性。
translated by 谷歌翻译
可穿戴传感器的指数升高在日常活动中评估生理参数时已经获得了重大兴趣。呼吸率是在生活方式活动的性能评估中使用的重要参数之一。但是,测量,运动伪影和其他噪声的突兀设置使过程复杂化。本文介绍了基于深度学习(DL)的多任务架构,用于估计来自心电图和加速度计信号的瞬时和平均呼吸速率,使得它在日常生活活动中有效地执行,如骑自行车,行走等。多任务网络包括组合编码器 - 解码器和编码器 - IncesNet,用于获取平均呼吸速率和呼吸信号。可以利用呼吸信号以获得呼吸峰和瞬时呼吸循环。平均绝对误差(MAE),根均线误差(RMSE),推理时间和参数计数分析用于将网络与当前艺术机器学习(ML)模型和其他研究中开发的DL模型进行比较。基于各种输入的其他DL配置也是作为工作的一部分开发的。该拟议模型显示出更好的整体准确性,并且在不同活动期间的单个方式提供了更好的结果。
translated by 谷歌翻译
We introduce an ensemble learning method based on Gaussian Process Regression (GPR) for predicting conditional expected stock returns given stock-level and macro-economic information. Our ensemble learning approach significantly reduces the computational complexity inherent in GPR inference and lends itself to general online learning tasks. We conduct an empirical analysis on a large cross-section of US stocks from 1962 to 2016. We find that our method dominates existing machine learning models statistically and economically in terms of out-of-sample $R$-squared and Sharpe ratio of prediction-sorted portfolios. Exploiting the Bayesian nature of GPR, we introduce the mean-variance optimal portfolio with respect to the predictive uncertainty distribution of the expected stock returns. It appeals to an uncertainty averse investor and significantly dominates the equal- and value-weighted prediction-sorted portfolios, which outperform the S&P 500.
translated by 谷歌翻译
Clinical semantic parsing (SP) is an important step toward identifying the exact information need (as a machine-understandable logical form) from a natural language query aimed at retrieving information from electronic health records (EHRs). Current approaches to clinical SP are largely based on traditional machine learning and require hand-building a lexicon. The recent advancements in neural SP show a promise for building a robust and flexible semantic parser without much human effort. Thus, in this paper, we aim to systematically assess the performance of two such neural SP models for EHR question answering (QA). We found that the performance of these advanced neural models on two clinical SP datasets is promising given their ease of application and generalizability. Our error analysis surfaces the common types of errors made by these models and has the potential to inform future research into improving the performance of neural SP models for EHR QA.
translated by 谷歌翻译
持续学习(CL)依次学习像人类这样的新任务,其目标是实现更好的稳定性(S,记住过去的任务)和可塑性(P,适应新任务)。由于过去的培训数据不可用,因此探索培训示例中S和P的影响差异很有价值,这可能会改善对更好的SP的学习模式。受影响函数的启发(如果),我们首先研究了示例通过添加扰动来示例体重和计算影响推导的影响。为了避免在神经网络中Hessian逆的存储和计算负担,我们提出了一种简单而有效的METASP算法,以模拟IF计算中的两个关键步骤,并获得S-和P-Aware示例的影响。此外,我们建议通过解决双目标优化问题来融合两种示例影响,并获得对SP Pareto最优性的融合影响。融合影响可用于控制模型的更新并优化排练的存储。经验结果表明,我们的算法在任务和类别基准CL数据集上都显着优于最先进的方法。
translated by 谷歌翻译
身份验证系统容易受到模型反演攻击的影响,在这种攻击中,对手能够近似目标机器学习模型的倒数。生物识别模型是这种攻击的主要候选者。这是因为反相生物特征模型允许攻击者产生逼真的生物识别输入,以使生物识别认证系统欺骗。进行成功模型反转攻击的主要限制之一是所需的训练数据量。在这项工作中,我们专注于虹膜和面部生物识别系统,并提出了一种新技术,可大大减少必要的训练数据量。通过利用多个模型的输出,我们能够使用1/10进行模型反演攻击,以艾哈迈德和富勒(IJCB 2020)的训练集大小(IJCB 2020)进行虹膜数据,而Mai等人的训练集大小为1/1000。 (模式分析和机器智能2019)的面部数据。我们将新的攻击技术表示为结构性随机,并损失对齐。我们的攻击是黑框,不需要了解目标神经网络的权重,只需要输出向量的维度和值。为了显示对齐损失的多功能性,我们将攻击框架应用于会员推理的任务(Shokri等,IEEE S&P 2017),对生物识别数据。对于IRIS,针对分类网络的会员推断攻击从52%提高到62%的准确性。
translated by 谷歌翻译
当前的抽象摘要模型要么仅通过突出源文档的一部分而缺乏明显的解释性或提供不完整的理由。为此,我们提出了摘要程序(SP),这是一个由二进制树的(有序)列表组成的可解释的模块化框架,每个框架都编码来自源文档的抽象摘要句子的分步生成过程。一个摘要程序每个摘要句子包含一个根节点,一棵不同的树将每个摘要句子(根节点)连接到派生的文档句子(叶节点),其中包含中间生成的句子的连接节点。边缘代表涉及摘要的不同模块化操作,例如句子融合,压缩和释义。我们首先建议通过神经模块提出有效的最佳搜索方法,SP搜索通过直接优化Rouge分数来识别人类摘要的SP搜索。接下来,使用这些程序作为自动监督,我们建议使用生成摘要程序的SEQ2SEQ模型,然后执行以获取最终摘要。我们证明,SP搜索有效地代表了使用通常忠于其预期行为的模块的人类摘要背后的生成过程。我们还进行了一项仿真研究,以表明汇总计划通过允许人类更好地模拟模型推理来改善摘要模型的解释性。汇总计划构成了朝着可解释和模块化的抽象摘要迈出的有希望的步骤,这是先前主要通过黑框端到端神经系统解决的复杂任务。我们的代码可从https://github.com/swarnahub/summarization Programs获得
translated by 谷歌翻译
在高度波动的加密货币市场中,设计盈利和可靠的交易策略是具有挑战性的。现有作品应用了深厚的增强学习方法,并在回测的乐观上报告了利润增加,这可能会因过度拟合而造成的假积极问题。在本文中,我们提出了一种实用方法,以解决使用深度强化学习的重新测试,以解决加密货币交易。首先,我们将过度拟合的检测作为假设检测。然后,我们训练DRL代理,估计过度拟合的可能性,并拒绝过度拟合的代理商,从而增加了良好交易绩效的机会。最后,在从05/01/2022到06/27/2022(在此期间加密货币市场崩溃两次)的测试期间的10次加密货币中,我们表明,过度拟合的深度强化学习剂的尖锐比率较高。更多过度合适的代理商,同等的权重策略和标准普尔DBM指数(市场基准),对可能部署到真实市场的可能性充满信心。
translated by 谷歌翻译
使热处理可控的一种可能的方法是收集有关产品当前状态的实时信息。通常,感觉设备无法轻松或根本捕获所有相关信息。数字双胞胎在实时模拟中使用虚拟探针缩小了这一差距,并与该过程同步。本文提出了一个基于物理的,数据驱动的数字双框架,用于自动食品处理。我们建议使用设备级别可执行的精益数字双胞胎概念,需要最小的计算负载,数据存储和传感器数据要求。这项研究重点是用于热过程的非侵入性降低模型(ROM)的简约实验设计。在训练数据中表面温度的高标准偏差与ROM测试中的均方根误差之间的高标准偏差之间的相关性($ r = -0.76 $)可以有效地选择训练数据。最佳ROM的平均均方根误差小于代表性测试集的1 kelvin(0.2%平均平均百分比误差)。 SP $ \ $ 1.8E4的仿真速度允许进行设备模型预测控制。拟议的数字双框架旨在适用于行业。通常,一旦在未提供对求解器的根级访问(例如商业仿真软件)中执行该过程的建模,就需要一旦在软件中执行该过程的建模,就需要进行非侵入式降级建模。仅使用一个数据集就可以实现降顺序模型的数据驱动训练,因为使用相关性来预测训练成功。
translated by 谷歌翻译
深度代码生成是软件工程深度学习(DL4SE)的主题,该主题采用神经模型来为预期功能生成代码。由于端到端的神经方法缺乏对域知识和软件层次结构的认识,因此结果通常需要手动校正。为了系统地探索代码生成的潜在改进,我们让IT参与从意图到实现的整个自上而下的发展,这在有限的范围中是可能的。在此过程中,它受益于大量样本,功能和知识。作为基金会,我们建议对代码数据(即代码分类法)建立分类法,利用代码信息的分类。此外,我们引入了三层语义金字塔(SP)以关联文本数据和代码数据。它标识了不同的抽象水平的信息,因此介绍了有关开发的领域知识,并揭示了软件的层次结构。此外,我们提出了一个语义金字塔框架(SPF)作为方法,重点是高模块化和低复杂性的软件。 SPF将代码生成过程分为阶段,并为潜在的相互作用提供储量。最终,我们为SPF构思了应用程序范围。
translated by 谷歌翻译